Projet Final : Vendée Globe

Récupération des fichiers Excel avec les classements

Création du dataset

Les fonctions ci-dessous permettent de générer le dataframe de classement à partir des fichiers télechargés.

Chaque fichier est lu et l'ensemble des colonnes sont parsées en respectant les types de données (avec encore un nettoyage).

Le dataframe est sauvegardé sous format Pickle pour en disposer sur le disque sans refaire toutes les opérations de nettoyage.

Chargement du Dataframe à partir du fichier Pickle sur le répertoire local

Extraction des caractéristiques techniques de chacun des voiliers

Les caractéristiques des bateaux sont concentrées dans le glossaire 3D du site du vendée globe, à l'url suivante : https://www.vendeeglobe.org/fr/glossaire

Je réalise un parsing via le package beautifullsoup :

Rapprochement des données des voiliers avec celle des classements

Corrélation et régression linéaire entre le classement et la vitesse utile des voiliers

J'appelle le classement 'Rang' et la vitesse utile des voiliers 'VMG'

La corrélation sur des bateaux observés au hasard n'est pas flagrante...

Conclusion

La pente de la droite de régression du rang en fonction des trois types de vitesses (VMGx) est négative, ce qui est attendu : plus la vitesse est grande, plus le classement est petit. On constate que le R2 est faible, ce qui signifie que le modèle explique peu les données. On confirme la première impression sur la faible corrélation entre la vitesse et le rang. C'est tout à fait normal car la vitesse présente une variance très importante.

Impact de la présence d'un foil sur le classement et la vitesse des voiliers

Conclusion :

On constate que les voiliers équipés de foils présentent des meilleurs résulats :

Visualisation de la distance parcourue pour chaque voilier

Conclusion :

La Heatmap permet de se rendre facilement compte des grandes variations et les événements particulier. Celle-ci montre la distance parcourue pour chaque jour. Plus les cases sont claires, plus la distance est grande. On peut constater :

Cartes avec les routes d'un ou plusieurs voiliers

Conclusion :

J'ai rencontré de grosses difficultés à coder sous Cartopy, et en plus il y a des bugs sous mac.

Je décide donc de coder une autre animation avec les bibliothèques de Plotly.

Utilisation de Plotly

Préparation du dataframe avec un classement par jour.

Même si le fichier est déjà éxécuté, vous pouvez faire bouger le curseur avec votre souris pour jouer l'évolution de la course à votre guise, ou appuyer sur "play".

Analyses de séries temporelles

On va analyser le classement en fonction du temps

Analyse

On voit très clairement les abandons (la ligne s'interrompt).

On voit aussi les sériées de skippers qui se font doubler en même temps, ceux qui se disputent une place au classement en échangeant leurs rangs plusieurs fois de suite...